앞선 두개의 글에서 kibana를 활용하여 데이터를 시각화 하는 방법에 대해 알아보았다.
이번글에서는 kibana가 제공하는 여러가지 시각화 툴을 이용하여 다양한 형태의 통계자료를 만들어 보고자 한다.
Line 차트를 이용해 통근 소요시간에 대한 그래프를 그려보았는데 평균적으로 출근과 퇴근하는데 걸리는 시간을 계산해보았다.
Visualize - Data - Metric 순서대로 들어가서 estimated 값을 기준으로 평균값을 계산해주면 된다.
그런데 한가지 주의 할 점이 외근,야근이나 약속등으로 바로 집으로 퇴근 하지 않은 경우엔 데이터가 누락되어 정확한 계산이 나오기 힘들었다.
그래서 가장 출퇴근 비율이 높은 버스 정류장의 시점과 종점을 기준으로 삼사 해당 구간의 통근 시간만 계산해 보기로 하였다.
우선 estimated를 기준으로 평균값을 계산한다음 filter로 travelStation을 선택하여 정류장 이름을 선택해주니 다음과 같은 결과가 나왔다.
통근시간 분석을 계획했을때 궁금했던점이 비가오거나 눈이 올때와 같이 기상상태가 좋지 않은 경우 교통체증이 좀더 심하게 느껴지는 경향이 있었는데 기상정보 통계 데이터와 나의 통근 시간도 관계가 있지 않을까 생각이 들어 기상정보 데이터도 수집하여 ES에 넣고 시각화를 해보았다.
그결과 다음과 같은 Dashboard를 만들 수 있었다.
강수량과 통근시간의 상관 관계를 한눈에 파악하긴 힘들었지만 비가 오는날이 평소보단 출근시간이 좀더 걸렸다는건 알 수 있었다.
아직은 1차원 적인 접근방법을 통하였기 때문에 단순이 데이터를 시각화 하는 수준이지만 앞으로 이를 활용하여 미래를 예측 할 수 있지 않을까 하는 생각도 들었다.
과거의 데이터를 기반으로 출근 시간이 대략 얼마정도 걸릴 것인지 어떤 교통수단이 효율적인지등 좀더 실생활에서 체감 할 수있는 데이터 활용이 가능 할 것같다.